Tumor segmentation in histopathology images is often complicated by its composition of different histological subtypes and class imbalance. Oversampling subtypes with low prevalence features is not a satisfactory solution since it eventually leads to overfitting. We propose to create synthetic images with semantically-conditioned deep generative networks and to combine subtype-balanced synthetic images with the original dataset to achieve better segmentation performance. We show the suitability of Generative Adversarial Networks (GANs) and especially diffusion models to create realistic images based on subtype-conditioning for the use case of HER2-stained histopathology. Additionally, we show the capability of diffusion models to conditionally inpaint HER2 tumor areas with modified subtypes. Combining the original dataset with the same amount of diffusion-generated images increased the tumor Dice score from 0.833 to 0.854 and almost halved the variance between the HER2 subtype recalls. These results create the basis for more reliable automatic HER2 analysis with lower performance variance between individual HER2 subtypes.
translated by 谷歌翻译
Data-driven modeling has become a key building block in computational science and engineering. However, data that are available in science and engineering are typically scarce, often polluted with noise and affected by measurement errors and other perturbations, which makes learning the dynamics of systems challenging. In this work, we propose to combine data-driven modeling via operator inference with the dynamic training via roll outs of neural ordinary differential equations. Operator inference with roll outs inherits interpretability, scalability, and structure preservation of traditional operator inference while leveraging the dynamic training via roll outs over multiple time steps to increase stability and robustness for learning from low-quality and noisy data. Numerical experiments with data describing shallow water waves and surface quasi-geostrophic dynamics demonstrate that operator inference with roll outs provides predictive models from training trajectories even if data are sampled sparsely in time and polluted with noise of up to 10%.
translated by 谷歌翻译
大量工作表明,机器学习(ML)模型可以泄漏有关其培训数据的敏感或机密信息。最近,由于分布推断(或属性推断)攻击引起的泄漏正在引起人们的注意。在此攻击中,对手的目标是推断有关培训数据的分配信息。到目前为止,对分布推理的研究集中在证明成功的攻击上,而很少注意确定泄漏的潜在原因和提出缓解。为了弥合这一差距,作为我们的主要贡献,我们从理论和经验上分析了信息泄漏的来源,这使对手能够进行分布推理攻击。我们确定泄漏的三个来源:(1)记住有关$ \ mathbb {e} [y | x] $(给定特征值的预期标签)的特定信息,((2)模型的错误归纳偏置,以及(3)培训数据的有限性。接下来,根据我们的分析,我们提出了针对分配推理攻击的原则缓解技术。具体而言,我们证明了因果学习技术比相关学习方法更适合特定类型的分布推理所谓的分配构件推理。最后,我们提出了分布推断的形式化,该推论允许对比以前更多的一般对手进行推理。
translated by 谷歌翻译
机器人的共同适应一直是一项长期的研究努力,其目的是将系统的身体和行为适应给定的任务,灵感来自动物的自然演变。共同适应有可能消除昂贵的手动硬件工程,并提高系统性能。共同适应的标准方法是使用奖励功能来优化行为和形态。但是,众所周知,定义和构建这种奖励功能是困难的,并且通常是一项重大的工程工作。本文介绍了关于共同适应问题的新观点,我们称之为共同构图:寻找形态和政策,使模仿者可以紧密匹配演示者的行为。为此,我们提出了一种通过匹配示威者的状态分布来适应行为和形态的共同模拟方法。具体而言,我们专注于两种代理之间的状态和动作空间不匹配的挑战性情况。我们发现,共同映射会增加各种任务和设置的行为相似性,并通过将人的步行,慢跑和踢到模拟的人形生物转移来证明共同映射。
translated by 谷歌翻译
腿部机器人可以穿越各种各样的地形,其中一些可能对轮式机器人(例如楼梯或高度不平衡的表面)具有挑战性。然而,四倍的机器人面临湿滑表面上的稳定挑战。可以通过切换到更保守和稳定的运动模式,例如爬网模式(始终与地面三英尺接触)或安排模式(一只脚一次接触)来防止这种方法来解决这一问题。潜在跌落。为了应对这些挑战,我们提出了一种从过去的机器人体验中学习模型的方法,以预测潜在的失败。因此,我们仅基于本体感受的感觉信息触发步态切换。为了学习这种预测模型,我们提出了一个半监督的过程,用于在两个阶段中检测和注释地面真相滑移事件:我们首先在步态数据的时间序列序列中使用无可教力的异常检测器检测到异常发生,然后,然后,然后检测到异常情况。在重播模拟中,通过人类知识进行了验证,以断言滑移事件。这些注释的滑移事件随后用作地面真理示例,以训练整体决策者,以预测跨地形的滑移概率以进行遍历。我们分析了由腿部机器人在具有湿滑地形的多个站点上记录的数据分析模型。我们证明,潜在的滑移事件可以预测在潜在跌倒之前的720毫秒之前,平均精度大于0.95,平均F评分为0.82。最后,我们通过将其在腿部机器人上部署并根据滑移事件检测切换其步态模式来实时验证我们的方法。
translated by 谷歌翻译
{g} {ustav} Fechner 1860年的心理物理学描述,即对其刺激的感觉的测量,被广泛认为是现代心理科学的出现。在心理物理学中,研究人员的参数会改变刺激的某些方面,并衡量人类受试者对该刺激的经历的变化;这样做可以深入了解感觉与唤起它的物理输入之间的关系。这种方法在感知域中大量使用,包括信号检测,阈值测量和理想的观察者分析。像视觉科学这样的科学领域始终依靠心理物理学的方法和程序,但是现在,机器学习研究人员对它们的越来越多,通过在生物学和人工感知之间扩大重叠\ cite \ cite {rojas2011automation {scheireratom,scheirer2014Perceptial2014Perceptual,Escalera2014ChaleAr2014Chalearearearearearnnag,Zhangy2018Agic, grieggs2021measuring}。由行为测量所指导的机器感知,而不是仅限于任意分配人类标签的指导,具有为人工智能进一步进步的巨大潜力。
translated by 谷歌翻译
物理模拟器在安全,不受约束的环境中方便学习加强学习政策表现出了巨大的希望。但是,由于现实差距,将获得的知识转移到现实世界可能会具有挑战性。为此,最近已经提出了几种方法来自动调整具有后验分布的实际数据,以在训练时与域随机化一起使用。这些方法已被证明在不同的设置和假设下适用于各种机器人任务。然而,现有文献缺乏对转移性能和实际数据效率的现有自适应域随机方法的详尽比较。在这项工作中,我们为离线和在线方法(Simopt,Bayrn,Droid,Dropo)提供了一个开放的基准,以阐明最适合每个设置和手头的任务。我们发现,在线方法受到下一次迭代的当前学会策略的质量受到限制,而离线方法有时可能会在使用开环命令中模拟中重播轨迹时失败。所使用的代码将在https://github.com/gabrieletiboni/adr-benchmark上发布。
translated by 谷歌翻译
多样性规划算法在单个搜索空间中找到各种不同的起点和目标之间的路径。它们旨在通过在计划查询中重复使用信息来有效地做到这一点。可以在搜索之前或期间计算此信息,并且通常包括有效路径的知识。使用已知的有效途径来解决单个计划查询要比找到全新的解决方案所花费的时间更少。这允许多算法(例如PRM*)在许多问题上胜过诸如RRT*之类的单个算法,但它们的相对性能取决于重复使用的信息。尽管如此,很少有多Qualery计划者明确地寻求最大程度地提高路径重复使用,因此,许多计划者并没有始终如一地超越单寻球替代方案。本文介绍了努力的通知路线图(EIRM*),这是一种几乎渐近的最佳多样性计划算法,明确优先考虑重复使用计算工作。 Eirm*使用非对称双向搜索来识别可能有助于解决单个计划查询的现有路径,然后使用此信息来订购其搜索并减少计算工作。这使其可以在经过测试的抽象和机器人多样性计划问题上的最新计划算法找到最高级别的初始解决方案。
translated by 谷歌翻译
背景:具有很小样本量的高维数据中的嵌入式特征选择需要优化模型构建过程的超参数。对于这种超参数优化,必须应用嵌套的交叉验证以避免偏向性能估计。由高维数据进行的重复训练导致了很长的计算时间。此外,它可能会观察到由小验证集中的异常值引起的个体性能评估指标的较高差异。因此,早期停止应用标准修剪算法来节省时间风险,以丢弃有希望的超参数集。结果:为了加快样本量微小数据的高维数据的速度选择,我们适应了最先进的异步连续的休息器。此外,我们将其与基于领域或先验知识的两种补充修剪策略相结合。一种修剪策略立即停止对所选超参数组合的语义上毫无意义的结果进行计算试验。另一个是一种新的外推阈值修剪策略,适用于具有较大性能评估指标差异的嵌套交叉验证。在反复的实验中,我们的组合修剪策略保持了所有有前途的试验。同时,与仅使用最先行的连续减半pruner相比,计算时间大大减少。训练训练的型号少于81.3 \%,获得了相同的优化结果。结论:所提出的组合修剪策略可以加速数据分析或在同一计算时间内更深入地搜索超参数。这导致了时间,资金和能源消耗大量节省,为高级,耗时的分析打开了大门。
translated by 谷歌翻译
由于自然语言处理和基于计算机视觉模型的显着进步,视觉问题应答(VQA)系统变得越来越聪明,高级。然而,在处理相对复杂的问题时,它们仍然易于出错。因此,在采用结果之前了解VQA模型的行为非常重要。在本文中,我们通过生成反事实图像来引入VQA模型的可解释方法。具体地,所生成的图像应该具有对原始图像具有最小可能的改变,并引导VQA模型来提供不同的答案。此外,我们的方法确保生成的图像是逼真的。由于无法使用定量度量来评估模型的可解释性,因此我们进行了用户学习,以评估我们方法的不同方面。除了在单个图像上解释VQA模型的结果,所获得的结果和讨论还提供了对VQA模型的行为的广泛解释。
translated by 谷歌翻译